高分文章RIP-seq和m6A峰图可视化两种方法-IGV和UCSC | m6A专题

Original 市场部-SLZ 联川生物 2022-06-07

收录于合集 #m6A 154个

IGV部分教程

老师一定觉得做完了RIP-seq、ATAC-seq、m6A-seq等项目，相对基因的某个区域高富集区域绘制peak calling的图，类似于下面展示的几种形式，当然这里的AI不是人工智能的意思，而是Adobe Illustrator的简称。

那么这种图是怎么得到的呢？目前有两种方法可以得到——bedtools和IGV都可以做出类似的图，bedtools操作较为复杂需要linux环境，而IGV则有桌面版软件。下面我们就来看看如何实现论文级别的矢量图。

第一步，去网上下载IGV软件，下载地址为http://software.broadinstitute.org/software/igv/download ，然后在文件夹IGV_Win_2.4.16/lib 下打开igv.jar（事先要安装JAVA8版本，JAVA9以上版本不能用），看到以下界面后，我们首选选择基因组信息，以本实验为例我们选择hg38版的人基因组信息。

我们从网上已公布的m6A测序结果中，选取中其中2个样本作为示例，挑选的基因为MT2A中某个转录本MT2A-201，这个转录本只有3个外显子，以便于老师理解。我们输入chr16:56,608,199-56,609,497作为想要查看的染色体区域信息输入进去后，变成了该区域的情况。我们可以看到在最下方，还出现了MT2A的2个外显子的结构。

第二步，输入每个样本的reads的mapping文件，文件以tdf、bigwig/bw、bedgraph等格式结尾。这些文件格式可以让公司专门为老师生成，老师只需要把该基因在染色体上的区域如chr16:56,608,199-56,609,497告诉我们即可，我们会为老师生成每个样本的相应格式文件了。我们拿到公司的这些格式后就可以导入到IGV了。

当然，这边想要自己操作的话，联川生物也提供了一些示例文件给大家。大家可以按照百度网盘的地址链接: https://pan.baidu.com/s/1e98FluMxu_64mIo2cx7iVw 提取码: qic6 ，或按照上图的小程序码直接打开百度网盘下载demo示例文件，进行测试。我们提供了ALKBH5_1和control总计2个样本4个文件，分别是2个Input和2个IP，且为两个不同的格式。

如果自己有linux运行环境的老师，或者正在学习的生信的朋友们，你们也可以自行根据bam文件生产tdf、bw等各种IGV软件支持的格式文件。

我们以tdf文件示例（当然bw以及bedgraph格式也是可以的），导入AY和B2L这两个样本进入IGV进行可视化。基因组信息，这边由于示例样本为human的hg38版本，其他物种请自行选择从在线数据或本地导入基因组信息。

如上图所示，这就是4个文库在chr16上特定区域里 reads的覆盖情况，我们可以发现某些区域reads覆盖度特别高，而有些区域几乎为0。但是这个颜色实在是太丑了！我们要对颜色进行替换。

单击右键的Change Track Color一栏，点开后我们把蓝色换成少女心爆棚的粉红色。这样子我们会看到背景色从蓝色变成了粉红色。

最后我们要从IGV导出图片，可不能直接用QQ截图Ctrl+Alt+A那种，而是要导出矢量图。什么叫矢量图，就是你无限放大后图片依然有很高的清晰度。所以我们选择了SVG格式。

即使SVG是矢量图，也无法得到我们想要的编辑格式。这时候我们需要先安装一个软件Adobe Acrobat。安装好Acrobat之后，我们用360网页浏览器打开SVG格式的文件作为示范。

从上图可以得知，在网页任意处点击右键，选择“打印”一栏。我们选择打印并非是真正要从打印机上打印，而是用PDF格式文件存起来。而输出的PDF格式文件里的各种元素，就是我们所说的矢量图必备。

需要注意的是在左侧需要对打印PDF文件一些参数和细节做一些调整。如本次例子所示，我们选择了A2纸大小，彩色等选项，并且可以在右侧预览打印效果。如果纸张过小很有可能会导致打印内容不全。最后我们就能愉快地输出PDF文档了。

打开PDF文档，推荐使用Adobe Acrobat，因为这款软件是在Adobe Reader的基础上可以修改PDF文档里的各种元素。如上面第一张图所示，刚才IGV内所显示的内容全部呈现在面前。但是请注意，这个图如果你按住快捷键Ctrl+鼠标滚轮，你可以无限放大和缩小，你会发现几乎不存在低像素的问题，而都是高清的元素。这就是我们前面讲到的矢量图。所以上面第二张图我们放大到400%后，你会发现里面的元素依旧很清晰！

这时候我们需要请出Adobe家族的另一款软件Adobe Illustrator，简称AI。在用AI打开这个PDF文件后，我们开始对多余元素进行删除。这里介绍几个Adobe AI软件的常用快捷键，Ctrl+鼠标滚轮就是左右移动画布，Alt+鼠标滚轮就是画布放大缩小，鼠标滚轮就是画布上下移动。

在打开PDF文档后，我们单独保存了一个.ai文件。而不同的修改方案，建议同时保存几套.ai文件以备不时之需。由于打开的图形如上图所示，是竖着的。

下一步就是要按住ctrl+A选中所有元素后，单击右键变换→旋转，选择270°即可。

调整好方向后，我就要对多余的元素进行删除，之前我们还要调整下画布的大小，在左侧工具栏点击即可。

上图就是各种元素删除后剩下的。这里添加一些自己感兴趣的元素，或者给已有的元素修改下颜色，或修改透明度。

这里推荐大家一本书，叫《生命科学插图从入门到精通——Adobe Illustrator使用技巧》，里面会告诉大家如何做出精美的无损论文插图。

我们继续在里面添加了一些文字和元素，当然这里只用了复制元素、添加文字和修改颜色等极少部分功能，更强大的功能还是请老师阅读《生命科学插图从入门到精通——Adobe Illustrator使用技巧》。

最后我们要输出矢量图的格式（PDF），可以在最上面的菜单栏单击文件→存储副本，保存为PDF格式即可。那么有老师会问了，我把这些图片导入到PPT里可不可以。我们的答案是可以，但是PPT再导出的图片就不是矢量图了，如果无限放大我们会发现图片的像素会越来越模糊。

另外有一个小技巧就是Nature和Cell杂志大部分图都为矢量图，我们可以用AI或者Acrobat软件把里面好的元素抠出来，做一些颜色的调整和形状转换，也可以放入自己的论文中增加亮点。

UCSC部分操作指南

我们登陆ucsc官网（https://genome-asia.ucsc.edu/ ）后选择对应的基因组版本和想要查看的基因名称。除了人、小鼠等模式生物外，诸如拟南芥等模式植物也被UCSC官网收录了。

界面主要区域分为两大块：展示的窗口界面和Track控制界面。调整track的“隐藏”、“压缩显示”、“全显示”等属性，以改变其在展示界面对应的展示情况

你会问：上面展示界面中的信息这么多，好乱啊，分都分不清……那么，请把鼠标移动到展示界面的最左侧，他会高亮显示当前track包括哪一部分的内容（下图绿色），并且显示一个小文本框，说明你这个当前track的名字，然后你不想要它显示了，可以右键选择（或者拉到页面下面的track部分），把对应的track属性选为“hide”即可。如果是下拉到track部分，选择后不要忘记“refrash”！

选择当前track的最左侧灰色条：直接使用鼠标拖拽它，改变和其他track的上下顺序；右键可展示和修改展示属性；直接点击，可以查看这个track一些详细的配置和了解这个track的详细说明信息。

导入我们要展示的信息：一般都是比对结果，展示丰度情况。

一般来说，如果有类似一些已经上传到ftp或者数据库等的数据的网址信息，特别是一些比较大的数据，一般需要一个web-accessible locations。如果使用上传的地址信息，可以直接用于上传UCSC Genome Browser，会比较方便——track Hubs。如果没有，可以参看对应的说明，针对需要展示的数据查看具体的上传方式——add custom tracks。bigBed, bigWig, bigGenePred, BAM and VCF文件的展示，一定要有一个web-accessible data storage（在线存储网站）。

可以使用deeptools产生的bigwig（bw）文件，但是bigwig文件一定要上传之后获取网址。可以尝试上传，具体方式可以参考UCSC的推荐（https://genome-asia.ucsc.edu/goldenPath/help/hgTrackHubHelp.html#Hosting ）。如果涉及到数据的保密等问题，可以尝试私有ftp设置外链接。这里我们推荐名为CYVERSE数据库https://de.cyverse.org/de/ 。

从上图中我们可以看到，当你注册完了CyVerse账号后，就可以将bigwig、bedGraph等格式进行上传，并生成能够直接被UCSC识别的超级链接地址。

可以改变deeptools的输出文件格式，可以使用outFileFormat为bedGraph形式，然后如果整个bedGraph文件过大，上传过慢，可以截取出关注基因或者关注区域的bedGraph文件，进行上传。

上传的bedGraph文件，在开头需要添加一列track line信息，生命文件格式、track name等。例如：track type=bedGraph name=DEMO color=0,128,0 visibility=full priority=20。

接下来我们上传了bedGraph格式用于测试的demo文件，在前面IGV已经提供了，这边尽量选择bedgraph结尾的文件的ALKBH5_1样本。如需要根据自己的样本生成，可以联系联川的售后人员来协助您。

如果还需要上传更多的track，基本上可以理论上不停添加。然后点击右侧的GO按钮。

前面的，基本可以满足需求了，美观的话就靠自己调整了。接下来讲，track叠加……

然后就是修改new collection track的名称，叠加的单track的颜色等。

隐藏掉不要的track，调整好之后，可以存成pdf矢量图哦！

大摩宏观策略谈：2025中美变局展望

假设，你遇到麦琳怎么办？

董事长两口子不干了，至暗时刻谁是白衣骑士

2024年心理咨询师报名通道开启！可考心理证书，无需辞职，名额有限，11月30日截止报名！！！

吴京捧红的白眼狼，爆红后却反咬一口，如今落魄到无戏可拍

高分文章RIP-seq和m6A峰图可视化两种方法-IGV和UCSC | m6A专题

您可能也对以下帖子感兴趣

大摩宏观策略谈：2025中美变局展望

假设，你遇到麦琳怎么办？

董事长两口子不干了，至暗时刻谁是白衣骑士

2024年心理咨询师报名通道开启！可考心理证书，无需辞职，名额有限，11月30日截止报名！！！

吴京捧红的白眼狼，爆红后却反咬一口，如今落魄到无戏可拍

生成图片，分享到微信朋友圈

高分文章RIP-seq和m6A峰图可视化两种方法-IGV和UCSC | m6A专题

您可能也对以下帖子感兴趣